「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题
「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题一家名为脸谱心智(FaceMind)的初创公司就在顶级学术会议 EMNLP 主会上系统性地揭示了这个问题,并给出了解法。更有意思的是,就在「马嘉祺」事件前不到两周,全球最强 AI 公司之一 Anthropic 也在自家产品中悄悄落地了一次高度相关的改造 —— 方向与脸谱心智一年前的论文几乎完全一致。
搜索
一家名为脸谱心智(FaceMind)的初创公司就在顶级学术会议 EMNLP 主会上系统性地揭示了这个问题,并给出了解法。更有意思的是,就在「马嘉祺」事件前不到两周,全球最强 AI 公司之一 Anthropic 也在自家产品中悄悄落地了一次高度相关的改造 —— 方向与脸谱心智一年前的论文几乎完全一致。
当Token开始进入套餐表,运营商试图扮演的角色,正在从“连接服务商”进一步变成“AI 算力入口”。就像当年电网把发电厂的电送进千家万户,运营商正在试图把智算中心里的算力,通过套餐和账单体系,变成像水、像电一样可以按月购买、按量消耗的公共资源。
Apple 必须面对它过去三年最难堪的一个问题——为什么全世界最贵的智能手机,装着一个最蠢的 AI 助手?当地时间 5 月 28 日,在发布会前十天,外媒率先曝光了答案。
过去一年,AI 出海应用,集中爆发:Gartner 预测 2026 年全球 AI 相关支出将达到 2.53 万亿美元,预计比去年增长 44%。IDC 预测未来五年的复合增速是 31.9%,届时全球 AI IT 投资将突破万亿美元大关。
编辑|Panda 数学正在迎来 AI 革命。 最近几个月尤为明显。比如,就在前几天,Google DeepMind 新论文宣布其最新系统 AlphaProof Nexus 在一次自主运行中,解决了 3
GPT-5.5 把进攻性网络安全最难的 7 个基准全部打穿,92.4% 正确率,评估体系直接失灵。AI 黑客能力每 6 个月翻一倍,而衡量它有多危险的尺子,已经先被干碎了。
ElevenLabs的声音克隆和长文本音频生成质量确实很好,但也太贵了。
OpenAI 公开介绍 Computer-Using Agent 时,讲的也是这个方向:模型针对图形界面交互做过训练,能把屏幕理解、任务目标和鼠标键盘动作接起来。鼠标会动只是表面。遇到按钮位置变化、弹窗多一层、页面慢一点时,它还能重新看屏幕,继续判断下一步。
当对话型 AI 服务于数十亿用户时,我们能否看见用户没说出口的那一层?JHU、MIT 和 Google Research 给出了新的解法。
有一个我们很少说出口的预设:AI 带来的恐慌是从下往上递减的。越底层越慌,越顶层越从容。应届生最危险,大厂高管有把握,基础模型公司的人?他们是在写未来,不是在应对它。